智能论文笔记

STEADY: Simultaneous State Estimation and Dynamics Learning from Indirect Observations

Jiayi Wei , Jarrett Holtz , Isil Dillig , Joydeep Biswas

分类：机器人 | 机器学习

2022-03-02

准确的动力学模型在许多机器人技术应用程序（例如越野导航和高速驾驶）中起着至关重要的作用。然而，学习随机运动动力学模型的许多最先进的方法需要对机器人状态作为标记的输入/输出示例进行精确测量，由于传感器功能有限，并且缺乏地面真相，在室外设置中可能很难获得。。在这项工作中，我们提出了一种新技术，用于通过执行同时进行状态估计和动力学学习，从嘈杂和间接观察中学习神经随机的动力学模型。所提出的技术迭代地改善了预期最大化环路中的动力学模型，其中E步骤采样了使用粒子过滤的后状态轨迹，并且M步骤更新动力学，以使通过随机梯度上升的采样轨迹更加一致。我们在模拟和实际基准测试中评估了我们的方法，并将其与几种基线技术进行比较。我们的方法不仅达到了更高的精度，而且对观察噪声也更加强大，从而显示出有望提高许多其他机器人应用的性能。

translated by 谷歌翻译

SOCIALGYM: A Framework for Benchmarking Social Robot Navigation

Jarrett Holtz , Joydeep Biswas

分类：机器人

2021-09-22

在动态人类环境中，机器人安全，以社会符合社会的方式移动是长期机器人自主权的必要基准。但是，完全在现实世界中学习和基准基准社会导航行为是不可行的，因为学习是数据密集型的，并且在培训期间提供安全保证是一项挑战。因此，需要基于仿真的基准测试，这些基准需要为社会导航提供抽象。这些基准测试的框架将需要支持各种各样的学习方法，对广泛的社会导航情景可扩展，并抽象出感知问题，以明确关注社会导航。尽管有许多提出的解决方案，包括高保真3D模拟器和网格世界近似，但现有的解决方案尚未满足上述所有用于学习和评估社会导航行为的属性。在这项工作中，我们提出了SocialGym，这是一个轻巧的2D模拟环境，用于机器人社交导航，并考虑到可扩展性，以及基于SocialGym的基准场景。此外，我们提出了基准结果，将人类工程和基于模型的学习方法比较和对比，以从演示（LFD）（LFD）和增强学习（RL）方法（RL）方法（适用于社交机器人导航）进行了构想。这些结果证明了评估的每项政策的数据效率，任务绩效，社会合规性和环境转移能力，以为未来的社会导航研究提供扎实的基础。

translated by 谷歌翻译

From fat droplets to floating forests: cross-domain transfer learning using a PatchGAN-based segmentation model

Kameswara Bharadwaj Mantha , Ramanakumar Sankar , Yuping Zheng , Lucy Fortson , Thomas Pengo , Douglas Mashek , Mark Sanders , Trace Christensen , Jeffrey Salisbury , Laura Trouille

分类：机器学习 | 计算机视觉

2022-11-08

Many scientific domains gather sufficient labels to train machine algorithms through human-in-the-loop techniques provided by the Zooniverse.org citizen science platform. As the range of projects, task types and data rates increase, acceleration of model training is of paramount concern to focus volunteer effort where most needed. The application of Transfer Learning (TL) between Zooniverse projects holds promise as a solution. However, understanding the effectiveness of TL approaches that pretrain on large-scale generic image sets vs. images with similar characteristics possibly from similar tasks is an open challenge. We apply a generative segmentation model on two Zooniverse project-based data sets: (1) to identify fat droplets in liver cells (FatChecker; FC) and (2) the identification of kelp beds in satellite images (Floating Forests; FF) through transfer learning from the first project. We compare and contrast its performance with a TL model based on the COCO image set, and subsequently with baseline counterparts. We find that both the FC and COCO TL models perform better than the baseline cases when using >75% of the original training sample size. The COCO-based TL model generally performs better than the FC-based one, likely due to its generalized features. Our investigations provide important insights into usage of TL approaches on multi-domain data hosted across different Zooniverse projects, enabling future projects to accelerate task completion.

translated by 谷歌翻译

No Language Left Behind: Scaling Human-Centered Machine Translation

NLLB team , Marta R. Costa-jussà , James Cross , Onur Çelebi , Maha Elbayad , Kenneth Heafield , Kevin Heffernan , Elahe Kalbassi , Janice Lam , Daniel Licht

分类：自然语言处理 | 人工智能

2022-07-11

在全球范围内消除语言障碍的目标的驱动下，机器翻译已巩固自己是当今人工智能研究的关键重点。但是，这样的努力围绕着一小部分语言结合在一起，留下了绝大多数低资源的语言。在确保安全，高质量的结果的同时，在牢记道德考虑的同时，打破200个语言障碍需要什么？没有留下的语言，我们首先通过与母语人士的探索性访谈来解决对低资源语言翻译支持的必要性来应对这一挑战。然后，我们创建了旨在缩小低资源和高资源语言之间的性能差距的数据集和模型。更具体地说，我们开发了一种有条件的计算模型，基于专家的稀疏混合物，该模型经过针对针对低资源语言量身定制的新颖有效的数据挖掘技术培训的。我们提出了多次建筑和培训改进，以抵消数千个任务的培训。至关重要的是，我们使用人类翻译的基准，Flores-200评估了40,000多种不同的翻译方向的性能，并将人类评估与新型毒性基准相结合，涵盖Flores-200的所有语言，以评估翻译安全性。我们的模型相对于先前的最新技术，实现了44％BLEU的改善，为实现通用翻译系统奠定了重要的基础。最后，我们开源此工作中描述的所有贡献，可在https://github.com/facebookresearch/fairseq/tree/nllb上访问。

translated by 谷歌翻译

HyperImpute: Generalized Iterative Imputation with Automatic Model Selection

Daniel Jarrett , Bogdan Cebere , Tennison Liu , Alicia Curth , Mihaela van der Schaar

分类： (统计)机器学习 | 机器学习

2022-06-15

考虑在数据集中插入缺失值的问题。一方面，使用迭代插补的一方面，传统的方法可以直接从学习条件分布的简单性和可定制性中受益，但遭受了对每个变量的适当模型规范的实际要求。另一方面，使用深层生成建模的最新方法受益于神经网络功能近似器的学习能力和效率，但通常很难优化和依赖更强大的数据假设。在这项工作中，我们研究了一种嫁给两者优势的方法：我们提出了 *Hyperibute *，这是一种适应性和自动配置列型模型及其超级参数的广义迭代插补框架。实际上，我们为开箱即用的学习者，优化者，模拟器和可扩展的接口提供具体的实现。从经验上讲，我们通过在各种公共数据集上通过全面的实验和敏感性调查了该框架，并证明了其相对于强大基准测试套件而产生准确的归精的能力。与最近的工作相反，我们认为我们的发现构成了对迭代归档范式的强烈辩护。

translated by 谷歌翻译

Learning from learning machines: a new generation of AI technology to meet the needs of science

Luca Pion-Tonachini , Kristofer Bouchard , Hector Garcia Martin , Sean Peisert , W. Bradley Holtz , Anil Aswani , Dipankar Dwivedi , Haruko Wainwright , Ghanshyam Pilania , Benjamin Nachman

分类：机器学习 | 人工智能

2021-11-27

我们概述了新兴机会和挑战，以提高AI对科学发现的效用。AI为行业的独特目标与AI科学的目标创造了识别模式中的识别模式与来自数据的发现模式之间的紧张。如果我们解决了与域驱动的科学模型和数据驱动的AI学习机之间的“弥补差距”相关的根本挑战，那么我们预计这些AI模型可以改变假说发电，科学发现和科学过程本身。

translated by 谷歌翻译

Inverse Contextual Bandits: Learning How Behavior Evolves over Time

Alihan Hüyük , Daniel Jarrett , Mihaela van der Schaar

分类：机器学习 | (统计)机器学习

2021-07-13

通过观察自己的行为来了解决策者的优先事项对于在医疗保健等决策过程中的透明度和问责制至关重要。尽管传统的政策学习方法几乎总是假定行为的平稳性，但在实践中几乎不正确：随着临床专业人员随着时间的流逝，医学实践不断发展。例如，随着医学界对器官移植的理解多年来的发展，一个相关的问题是：实际的器官分配政策如何发展？为了给出答案，我们希望采用一种政策学习方法，该方法提供了可解释的决策代表，尤其是捕获代理商对世界的非统计知识，并以离线方式运作。首先，我们将决策者的不断发展的行为对上下文的强盗进行了建模，并正式化了背景匪徒（ICB）的问题。其次，我们提出了两种混凝土算法作为解决方案，学习代理行为的学习参数和非参数表示。最后，使用真实和模拟数据进行肝移植，我们说明了我们方法的适用性和解释性，以及基准测试并验证其准确性。

translated by 谷歌翻译